Cell :万物可控!机器学习如何解锁蛋白质“开关”,开启活体按需功能调控新时代?
来源:生物探索 2025-06-02 10:51
这项颠覆性技术,首次实现了在活体小鼠(living mice)体内,对多种蛋白质进行精准、通用、可逆的化学激活和功能调控!
想象一下,如果生命中的每一个蛋白质(protein)都能像电视开关一样,被你精准地开启或关闭,那将是怎样一番景象?作为生命机器的精密部件,蛋白质的功能是所有生物活动的基石。然而,长期以来,研究人员面临着一个巨大的挑战:如何在复杂的活体(in vivo)环境中,以前所未有的精度对特定蛋白质进行按需(on-demand)调控?传统的光控(photo-control)方法往往受限于光线穿透深度,难以触及深层组织;而复杂的基因工程(genetic engineering)手段又可能改变蛋白质的天然功能,甚至引发意想不到的副作用。
难道,精准“遥控”生命仅仅是一个遥远的梦想?
好消息来了!5月27日《Cell》上发表了一项里程碑式的研究“Machine-learning-assisted universal protein activation in living mice”,为我们带来了梦想中的“生命遥控器”——CAGE-Proxvivo 策略。这项颠覆性技术,首次实现了在活体小鼠(living mice)体内,对多种蛋白质进行精准、通用、可逆的化学激活和功能调控!
这套系统,核心原理在于给目标蛋白质穿上一个特制的“隐身衣”(笼子),暂时“锁住”它的功能。当需要时,只需注入一把特定的“钥匙”,就能在活体环境中精确“揭开”这层隐身衣,让蛋白质瞬间“重获自由”,恢复其天然活性。这把“钥匙”的制造和“隐身衣”的精准设计,得益于最前沿的机器学习(Machine Learning) 技术!它如何帮助科学家们巧妙地改造蛋白质,实现前所未有的生命“遥控”?它又将如何彻底改变我们对生命调控的认知和疾病干预的方式,为肿瘤治疗、免疫调节等领域带来革命性突破?
解锁生命“遥控器”:CAGE-Proxvivo 的核心原理
在CAGE-Proxvivo策略中,研究团队巧妙地将蛋白质的“开关”功能设计成了一套“笼子”(cage)与“钥匙”(key)系统。想象一下,一个微小的“笼子”被精巧地安装在蛋白质的关键位置,暂时“锁住”了它的功能。当需要激活蛋白质时,只需递送一把特定的“钥匙”,就能在活体环境中将“笼子”移除,让蛋白质重新“自由”,恢复其天然活性。
这项技术的关键在于引入了一种独特的非天然氨基酸(unnatural amino acid, ncAA)—— TCOY (trans-cyclooctene-caged tyrosine)。TCOY是一种被“笼子”包裹的酪氨酸(tyrosine)衍生物。当TCOY被遗传编码(genetically encoded)到蛋白质的活性位点(active site)或关键相互作用界面附近时,它庞大的体积会形成空间位阻(steric hindrance),有效抑制蛋白质的功能。
那么,如何“解开”这个“笼子”呢?研究团队选择了生物正交裂解反应(bioorthogonal cleavage reaction)中效率极高、对活体兼容性极强的 逆电子需求Diels-Alder反应 (inverse-electron-demand Diels-Alder reaction, IEDDA)。他们合成了一系列叠氮化四嗪(tetrazine, Tz)衍生物作为“钥匙”。实验发现,在所有测试的四嗪“钥匙”中,3,6-二甲基-1,2,4,5-四嗪(Me2Tz) 表现出最高的解笼效率,在实验条件下,仅需30分钟就能使TCOY的脱笼率达到惊人的80%以上。这意味着,Me2Tz能够快速、高效地“解锁”TCOY,从而恢复蛋白质功能。
与传统的光控方法相比,化学小分子(small molecule)介导的脱笼(decaging)具有无可比拟的优势,尤其是在活体应用中。小分子可以克服紫外光(UV light)穿透深度有限的问题,轻松到达小鼠体内的深层组织,实现对各种器官、细胞和生物过程的精准操控,真正做到“按需激活”。CAGE-Proxvivo的诞生,正是为解决活体环境中蛋白质调控的普适性与精准性难题而生。
“智慧”进化:机器学习如何加速生物发现
要将TCOY这个“笼子”精准地安装到目标蛋白质的特定位点,需要一种特异性的“工具”——氨酰tRNA合成酶(aminoacyl-tRNA synthetase, aaRS)。然而,自然界中并没有能够识别TCOY的aaRS,这意味着研究人员必须对现有的aaRS进行“定向进化”(directed evolution),改造它们使其能够特异性地识别TCOY,并将其连接到tRNA(转运RNA)上,最终通过遗传密码扩增(genetic code expansion, GCE)技术将TCOY插入到目标蛋白质中。
传统的aaRS定向进化是一个浩大且充满挑战的工程,它涉及到巨大的序列空间探索、复杂的功能筛选,就像在浩瀚的沙海中寻找一颗特定的珍珠。为了加速这一过程,研究团队引入了机器学习这一“智慧”助手。
他们构建了一个创新的机器学习流程:
数据收集与准备:首先,研究团队收集了117个已知的aaRS突变体库,并系统地筛选了七种酪氨酸类似物,评估它们与aaRS突变体之间的识别效率。初步测试发现,没有一个现有的aaRS突变体能有效识别TCOY。
特征提取与模型训练:他们将蛋白质序列数据(sequence-based features)和结构数据(structure-based features)结合起来。序列特征来源于最先进的蛋白质语言模型(protein language models),如UniRep(统一表征模型)和ESM(进深标度模型),这些模型能够从海量蛋白质序列中学习到蛋白质的内在规律。结构特征则通过AlphaFold2预测蛋白质结构,并利用RosettaLigand(罗斯塔配体)和CartesianDDG(笛卡尔差分增益)等计算方法,精确模拟aaRS与TCOY的相互作用能量和空间位阻。
所有这些特征被整合起来,输入到一个经过监督学习(supervised learning)训练的二元分类器(binary classifier)中。这个分类器能够根据输入特征,预测aaRS突变体识别TCOY的效率。
智能筛选与实验验证:模型根据预测的识别效率对aaRS突变体进行排名。研究团队选择了预测得分最高的12个PyIRS(pyrrolysine-aaRS)变体进行实验验证。最终成功筛选出两个能够高效将TCOY插入绿色荧光蛋白(GFP)的PyIRS突变体!
通过液相色谱-质谱联用(LC-MS)分析,研究人员进一步验证了TCOY成功编码到GFP中的高保真度(fidelity)以及Me2Tz诱导的脱笼效率。例如,带有TCOY笼子的GFP(GFP-N149TCOY)的预期分子量为27880 Da,经过Me2Tz处理后,成功脱笼产物GFP-N149-Y的分子量变为27772 Da,这与预期结果高度一致,证实了脱笼的有效性。此外,该技术还成功将TCOY插入活细胞膜上的视紫红质(rhodopsin)中,展示了其在膜蛋白(membrane proteins)应用上的巨大潜力。
这项工作首次将机器学习引入aaRS进化领域,不仅加速了特定非天然氨基酸的发现,更重要的是,它提供了一个通用框架,未来有望应用于更多类型非天然氨基酸的遗传编码,极大地拓展遗传密码扩增技术的应用范围。
从“沉睡”到“觉醒”:体内蛋白激活的魔力
有了能够精准编码和高效脱笼TCOY的工具,研究团队迫不及待地将CAGE-Proxvivo策略推向了活体动物实验。他们选择萤火虫荧光素酶(firefly luciferase, fLuc)作为模型蛋白,因为其生物发光(bioluminescent)强度能够直观地反映蛋白质的活性变化。
通过计算筛选,研究团队找到了fLuc催化口袋(catalytic pocket)附近的关键“锚定位点”(anchor sites)。他们发现,在fLuc的F250或Y255位点引入TCOY,可以有效抑制fLuc的活性。当对这些笼罩的fLuc进行化学脱笼后,其活性可以得到显著恢复。具体数据显示,fLuc-F250TCOY在脱笼后活性提高了10倍以上。
更令人兴奋的是活体实验结果。研究人员将表达TCOY笼罩fLuc变体(fLuc-F250TCOY)的HEK293T(人胚肾293T)细胞皮下移植到小鼠体内,形成异种移植模型(xenograft model)。随后,通过尾静脉注射(tail-vein injection)Me2Tz“钥匙”,成功在活体小鼠体内诱导了IEDDA反应,使fLuc活性得到显著恢复,小鼠体内的生物发光强度随之升高。
CAGE-Proxvivo的潜力远不止于此。研究团队进一步将其应用于一种强大的治疗性蛋白质——炭疽致死因子(anthrax lethal factor, LF)。LF是炭疽毒素(anthrax toxin)的关键组分,能够通过裂解促分裂素原活化蛋白激酶激酶(MAPK kinase, MEK3)诱导细胞凋亡(apoptosis)。然而,直接使用LF具有全身毒性。研究团队巧妙地将LF的活性位点(Y659)笼罩,形成LF-Y659TCOY。
为了实现肿瘤特异性激活,他们将LF-Y659TCOY与表皮生长因子-保护性抗原(EGF-PA)融合。EGF-PA能够特异性靶向过表达表皮生长因子受体(EGFR)的肿瘤细胞。实验证明,这种笼罩的LF-Y659TCOY仅在EGFR过表达的A431(人表皮样癌)细胞中,且在Me2Tz脱笼后才引起MEK3的裂解和细胞死亡,而对EGFR缺陷的A375细胞则没有影响。
在活体肿瘤模型中,CAGE-Proxvivo展示了其强大的抗肿瘤潜力。将表达EGFR的A431细胞移植到小鼠体内形成肿瘤。通过腹腔注射(intraperitoneal injection)EGF-PA/LF-Y659TCOY,并在一天后尾静脉注射Me2Tz,成功在肿瘤部位激活LF。实验结果显示,经EGF-PA/LF-Y659TCOY结合Me2Tz治疗的小鼠,肿瘤生长受到了显著抑制,肿瘤体积在整个实验周期内均远小于对照组小鼠。这表明CAGE-Proxvivo能够实现肿瘤细胞特异性激活,有效杀伤肿瘤。
更值得关注的是,研究团队还利用CAGE-Proxvivo成功诱导了肿瘤细胞的细胞焦亡(pyroptosis)。细胞焦亡是一种伴随炎症(inflammatory)反应的程序性细胞死亡,能够释放多种细胞因子,激活机体的抗肿瘤免疫(antitumor immunity)。实验数据显示,LF处理可以诱导小鼠肺癌LLC细胞发生细胞焦亡,表现为显著的乳酸脱氢酶(LDH)释放、碘化丙啶(propidium iodide, PI)染色阳性、半胱天冬酶-8(caspase-8)和半胱天冬酶-3(caspase-3)的激活以及膜蛋白焦亡素E(GSDME)的裂解。在活体小鼠中,肿瘤部位的LF激活导致CD3阳性T细胞(CD3+ T cells)和CD8阳性T细胞(CD8+ T cells)等免疫细胞数量显著增加,并进一步抑制了肿瘤生长。这为开发新型免疫疗法(immunotherapy)提供了新的思路。
精准“把脉”:调控蛋白间相互作用
蛋白质-蛋白质相互作用(protein-protein interactions, PPIs)是所有生命活动的核心,它们调控着细胞信号传导(cell signaling)、基因表达(gene expression)以及抗体-抗原识别(antibody-antigen recognition)等关键过程。精准调控PPIs对于理解疾病机制和开发靶向药物至关重要。
研究团队进一步将CAGE-Proxvivo策略拓展到PPIs的调控。通过对331个已知PPI界面的氨基酸丰度(amino acid abundance)和结合亲和力(binding affinity)影响进行分析,研究人员发现,酪氨酸(tyrosine) 在PPI界面中出现的频率较高,且将其突变为其他氨基酸对蛋白质稳定性的影响最小。这证实了酪氨酸是PPI操作中理想的“界面笼子”(interface cage)残基。
为了验证这一概念,他们使用了裂解型荧光素酶(split fLuc)作为报告系统。研究团队发现,在fLuc的界面位点(如I423和F465)引入TCOY,可以有效抑制其相互作用,而Me2Tz的加入则能使其恢复活性,激活效率均达到10倍以上。
随后,研究团队将CAGE-Proxvivo应用于调控肿瘤免疫(tumor-immune)界面的关键PPI——程序性死亡受体1(PD-1)与其配体PD-L1(PD-L1)之间的相互作用。PD-1/PD-L1通路是肿瘤细胞逃避宿主免疫清除的重要检查点。实验结果显示,在PD-L1的Y123位点引入TCOY(PD-L1-Y123TCOY)后,其与PD-1的结合几乎完全被阻断,导致T细胞报告系统中的荧光素酶活性显著增强,表明检查点抑制被解除。而当加入Me2Tz进行脱笼后,PD-1/PD-L1的结合得到恢复,T细胞活性恢复到与野生型PD-L1相似的抑制水平。这充分证明了CAGE-Proxvivo能够精确地化学调控细胞表面的PPIs,为肿瘤免疫检查点(immune checkpoint)调控提供了新策略。
“智能”抗癌:生物正交门控抗体引发免疫风暴
在肿瘤治疗领域,T细胞衔接器(T cell engager, TCE)双特异性抗体(bispecific antibody)因其能够募集T细胞攻击肿瘤细胞而备受关注。然而,传统TCEs的潜在脱靶毒性(off-target toxicity)和全身性细胞因子释放综合征(cytokine release syndrome, CRS)是其临床应用的主要障碍。为了提高安全性,研究团队提出了一种“逻辑门”(logic gate)策略,即T细胞的激活必须满足多个条件才能开启。
CAGE-Proxvivo为实现这种“门控”抗体(gated antibody)提供了理想的平台。他们设计了一种生物正交门控的抗CD3抗体(anti-CD3 antibody, aCD3),通过TCOY笼罩来控制其与T细胞表面CD3抗原的结合。研究团队以靶向HER2(人表皮生长因子受体2)的ZHER2-aCD3抗体为例进行验证。
他们发现,在aCD3的Y59位点引入TCOY(ZHER2-aCD3-Y59TCOY),几乎可以完全阻断其与CD3的结合,而Y103位点笼罩的抗体仅部分阻断。这使得T细胞在没有Me2Tz“钥匙”时,即使遇到肿瘤细胞,也不会被异常激活,从而降低了全身性毒性。当Me2Tz被注射到肿瘤部位后,Y59位点的TCOY被高效脱笼,抗体恢复了与CD3的结合能力,并以高荧光恢复率证实了结合的恢复。
活体实验进一步印证了门控抗体的优势。研究团队在小鼠模型中观察到,与传统TCEs相比,ZHER2-aCD3-Y59TCOY显著降低了小鼠血清中白介素-6(IL-6)和干扰素-γ(IFN-γ)等炎性细胞因子(inflammatory cytokine)的水平,这预示着更低的CRS风险,提高了治疗安全性。同时,化学脱笼后的ZHER2-aCD3-Y59TCOY显著促进了T细胞向肿瘤组织的浸润(infiltration),并有效抑制了肿瘤生长。在NOD-SCID(非肥胖糖尿病-严重联合免疫缺陷)小鼠模型中,ZHER2-aCD3-Y59TCOY与Me2Tz的联合治疗,使得肿瘤体积得到了显著抑制,肿瘤增长速度远低于对照组。
这项工作还展示了CAGE-Proxvivo的通用性。除了酪氨酸,研究团队还成功地将另一种重要的非天然氨基酸——TCO-半胱氨酸(TCO-cysteine, TCOC)进行遗传编码。半胱氨酸(cysteine)在蛋白质功能中扮演着多种重要角色。通过机器学习辅助,他们同样找到了能够高效识别TCOC的PyIRS变体,并验证了其在活体细胞中激活海肾荧光素酶(Renilla luciferase, RLuc)的能力。TCOC的成功编码,进一步证明了CAGE-Proxvivo作为通用平台的强大潜力。
开启生物医学新纪元
CAGE-Proxvivo策略的成功开发,是蛋白质工程和化学生物学领域的里程碑。它实现了在活体小鼠体内对蛋白质功能、蛋白质-蛋白质相互作用的按需精准化学调控,其核心优势在于:
普适性:该平台能够适用于多种不同类型的蛋白质,包括酶(enzymes)、受体(receptors)和抗体(antibodies)等。
活体兼容性:化学小分子诱导的脱笼克服了传统光控技术的组织穿透深度限制,使得深层组织和器官的蛋白质调控成为可能。
机器学习赋能:首次将蛋白质语言模型与结构建模相结合,极大地加速了非天然氨基酸遗传编码体系的开发效率,为未来更广泛的非天然氨基酸应用奠定基础。
精准调控:无论是激活单个蛋白质的功能,还是调控复杂的蛋白质相互作用网络,CAGE-Proxvivo都能提供高精度的时空控制。
这项技术不仅为基础生物学研究提供了强大的“功能获得性研究”(gain-of-function study)工具,帮助研究人员更深入地理解复杂生命过程的动态变化,更在转化医学(translational medicine)领域展现出巨大的应用前景。例如:
新型前药(prodrug)设计:将药物活性组分以笼罩形式递送,仅在病灶部位(如肿瘤)激活,从而最大程度地降低全身毒副作用,提高治疗效率。
精准免疫疗法:开发“门控”抗体和T细胞衔接器,在特定条件下激活免疫细胞,避免脱靶效应和细胞因子风暴。
其他疾病治疗:该平台有望应用于自身免疫性疾病(autoimmune diseases)、神经退行性疾病(neurodegenerative disorders)和代谢性疾病(metabolic conditions)等领域,实现对异常蛋白质功能的精准干预。
当然,CAGE-Proxvivo策略仍有提升空间,例如进一步扩展非天然氨基酸的种类、优化小分子触发器的药代动力学(pharmacokinetics)特性以及提高蛋白质在活体内的递送效率等。但毫无疑问,这项创新成果为我们提供了一个前所未有的窗口,去探索生命的奥秘,并为攻克人类疾病带来新的希望。
未来,我们或许真的能手握“遥控器”,在生命舞台上,精准地编织出我们期待的华章!
版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
